Národní úložiště šedé literatury Nalezeno 8 záznamů.  Hledání trvalo 0.00 vteřin. 
Zpracování řeči

Sborník Workshopu o zpracování řeči je periodická publikace obsahující příspěvky přednesených na workshopech organizovaných každoročně v září v Praze. Letošní sborník obsahuje 30 příspěvků od 55 autorů. Příspěvky jsou věnovány fonetice a prosodii, konstrukci dialogů, analýze, syntéze a zvýrazňování řeči, rozpoznávání mluvčího a řeči a konversi hlasu.
Použití hřebenové filtrace při zvýrazňování řeči
Vondra, Martin ; Vích, Robert
V článku je popsána zdokonalená metoda jednokanálového zvýrazňování řeči pomocí hřebenové filtrace. Hřebenový filtr je adaptivní s kmitočtem základního tónu řeči a je použit v kmitočtové oblasti.
Úvodní kurs počítačového zpracování řeči pro studenty bakalářského studia
Nouza, Jan
Článek představuje koncepci jednosemestrálního předmětu, který autor připravil a vyučoval během svého pobytu na ETH v Curychu v roce 2006.
Algoritmy potlačení šumu v řeči zkreslené telekomunikační sítí
Koula, Ivan ; Esposito, A.
Příspěvek porovnává efektivitu tří odlišných algoritmů zvýraznění řeči. Hodnocení efektivity je založeno na určení procentuelní úspěšnosti rozpoznání zpracované řeči pomocí řečového rozpoznávače. Všechny popsané algoritmy jsou založeny na metodě spektrální subtrakce, ale liší se rozdílným způsobem odhadu výkonového spektra šumu. První algoritmus provádí odhad statistickou analýzou spektrálních vlastností signálu obsaženého v řečových pauzách. Zbylé dva algoritmy odhadují výkonové spektrum šumu pomocí nelineárních adaptivních modelů.
Experimenty se vzájemnou záměnou řečových stylů s použitím lineárního mapování průběhu FO v časové oblasti
Přibil, Jiří ; Přibilová, Anna
V anotaci článku jsou popsány experimenty se vzájemnou záměnou řečových stylů prováděné na promluvách generovaných TTS systémem se základní prozodií. Prototypy řečových stylů odvozené z pěti emocionálnách stavů byly získány z promluv se shodným informačním obsahem. Problém s rozdílnou délkou prototypu a cílové věty byl řešen s použitím lineárního mapování v časové oblasti. Výsledky byly hodnoceny pomocí poslechových testů promluv po provedené resyntéze.
Možnosti modelování prozodie TTS systému Epos s použitím MBROLA rozhraní
Horák, Petr ; Chaloupka, Zdeněk
Příspěvek se zabývá možnostmi modelování prosodie v TTS systému EPOS. Cílem je vytvořit TTS systém, který je schopný modelovat trvání jednotlivých hlásek a tím dosáhnout snadného využití MBROLA kompatibilních českých hlasů. Epos je jazykově nezávislý systém pro převod textu do řeči (Text-To-Speech). Může být konfigurován v širokých mezích bez nutnosti nové kompilace. Využitím editovatelných pravidel pro každý krok syntézy nabízí Epos možnost sledování celého procesu a snadný postup při aplikaci změn.
Redukce hudebního šumu v systémech slepé separace zdrojů založených na časově-frekvenčním binárním maskování
Čermák, Jan ; Araki, S. ; Sawada, H. ; Makino, S.
Slepá separace signál (BSS) je úloha zabývající se rekonstrukcí N signálů z M směsí. Rekonstrukce probíhá bez znalostí zdrojových signálů a okolního prostředí. V tomto článku jsme se zaměřili na zlepšení BSS metody nazývané časově-frekvenční binární maskování (TFBM). TFBM je universální přístup umožňující separaci zdrojů i v případě kdy N>M. Nevýhoda tohoto přístupu je degradace separovaného signálu hudebním šumem. Je popsána metoda, která redukuje hudební šum a zároveň zlepšuje kvalitu separace.
Použití RLPC inventářů systému Festival v Eposu
Chaloupka, Zdeněk ; Horák, Petr
Cílem tohoto příspěvku je popsat možnosti implementace nových hlasů do text-to-speech (TTS) systému Epos. Pro implementaci jsme použili inventáře TTS systému Festival. Inventáře obsahují komprimované řečové jednotky v podobě koeficientů Residuálně Lineárního Predikčního Kódování (RLPC) a další nutné informace pro syntézu řeči. Text je předáván systému Epos v MBROLA formátu a je tedy možné přímo určovat délku hlásek i tvar prosodie.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.